
登顶开源AI软件工程师榜首,UIUC无Agent方案轻松解决SWE-bench真实编程问题
登顶开源AI软件工程师榜首,UIUC无Agent方案轻松解决SWE-bench真实编程问题自从 Devin(首个全自动 AI 软件工程师)提出以来,针对软件工程的 AI Agent 的设计成为研究的焦点,越来越多基于 Agent 的 AI 自动软件工程师被提出,并在 SWE-bench 数据集上取得了不俗的表现、自动修复了许多真实的 GitHub issue。
自从 Devin(首个全自动 AI 软件工程师)提出以来,针对软件工程的 AI Agent 的设计成为研究的焦点,越来越多基于 Agent 的 AI 自动软件工程师被提出,并在 SWE-bench 数据集上取得了不俗的表现、自动修复了许多真实的 GitHub issue。
生成式 AI 碰撞上自动驾驶技术,会产生怎样的火花?过去,生成式 AI 在业界已经被用来解决自动驾驶的长尾问题。目前,学界开始尝试在算法仿真领域引入多 Agent 数据集来增强仿真的效果。
AI 崛起,能够自主规划并执行多个步骤的 Agents,正成为用户的接口,也成为开发者的核心着力点。
Agentic AI是比下一代基础模型更具潜力的AI发展方向
如封面展示,就在昨天,特工宇宙作为合作伙伴,参与了扣子动手实验室的杭州站活动。
半个月前,粗心的我细心地发现,有一本关于 Agent 的书籍竟然在上市预售,作者还是熟悉的咖哥(黄佳老师,当年拜读过他的《零基础学机器学习》)果断下单。 而在昨天,我终于收到了!立刻花了半个小时品读起来~觉得还是非常不错的,所以忍不住给大家分享推荐一下!
在 5 月 17 日的“腾讯云生成式AI产业应用峰会”上,基于混元大模型的一站式 AI 智能体创作与分发平台——腾讯元器首次亮相。
大语言模型可谓是迄今为止对人类行为最大的建模,如何借助大语言模型工具,让科技发展更好地应用到真实人类社会中去?从哈佛物理系到大语言模型结合社会学和经济学的研究,朱科航的思考路径,聚焦在对人类行为的深度学习和理解。在开始今天阅读之前,大家不妨先猜一猜,大语言模型之前人类应用最广的 TOP2 机器学习是什么?Enjoy
AI Agent 的潜力和挑战
传统 LLM-based AI Agent 运维平台在复杂应用开发方面存在一定局限 ,复旦大学人工智能创新与产业研究院(AI³)徐盈辉研究员与 AI2Apps 团队打造的 AI2Apps 可视化集成开发环境集成了工程级的开发工具,覆盖 AI Agent 完整开发周期,具有完全开放的扩展性,并自带浏览器沙盒环境,借鉴 Figma 的理念